spider یا خزنده موتور های جستجو چگونه کار می کند
موتورهای جستجو محتویات یک وب سایت را بافرستادن spider در بانک اطلاعاتی خود ذخیره می کنند که در اصطلاح به آن bots می گویند
خزنده های موتور جست وجو محتویات صفحه را خط به خط خوانده وذخیره می کنند چنانچه این خزنده ها در محتویات سایت به لینکهایی برخورد کنند آن را ثبت می کنند ویک botجدید جهت جمع آوری اطلاعات آن ارسال می کنند
بنابراین وبمسترها نیازی به ثبت دستی سایت خود در موتورهای جستجو ندارند زیرا spider ها می توانند کلیه سایت های تحت وب را پیدانمایند
جمع آوری کننده اطلاعات با نام های اسپایدر ،روبوت و کراولر شناخته شده است آن بخش از موتور جست وجو است که جمع آوری اطلاعات به عهده دارد اسپایدر مشخص می کند که کدام صفحات مورد بازدید قرار گیرند ممکن است طوری برنامه ریزی شده باشد که فقط صفحات خاصی را ببیند اسپایدر محتوای سایت ها را می خواند و اطلاعات آن را جمع آوری می کند و در اختیار موتور جست وجو قرار می دهد کار اسپایدر شبیه کار کاربران وب است. اسپایدر کدهای سازنده صفحات و کاربران را می بیند رد پای اسپایدر هنگام بازدید صفحات یک سایت روی سرور آن می ماند یکی از فعالیت های مهمی که در بازاریابی با موتور های جست وجو انجام میشود تحلیل دید و بازدید های اسپایدر است
خزنده یا اسپایدر (Spider) یک برنامه کامپیوتری است که به طور خودکار و اتوماتیک وبسایتها را دریافت میکند و اطلاعات موجود در آنها را جمعآوری میکند. این برنامهها توسط موتورهای جستجو مانند گوگل، بینگ و یاهو برای فهرستبندی صفحات وب و جستجوی اطلاعات استفاده میشوند.
فرآیند کار اسپایدر به شکل زیر است:
1. شروع با URL اولیه: اسپایدر با شروع از یک یا چند URL اولیه، معمولاً از صفحه اصلی یک وبسایت، شروع به کار میکند.
2. دریافت صفحه: اسپایدر به طور اتوماتیک به URL ارسال شده میرود و صفحه مربوطه را دریافت میکند.
3. تجزیه و تحلیل HTML: بعد از دریافت صفحه، اسپایدر HTML آن را تجزیه و تحلیل میکند تا لینکها، متنها، تصاویر و سایر عناصر موجود در آن را استخراج کند.
4. دنبال کردن لینکها: اسپایدر لینکهای موجود در صفحه را پیدا کرده و آنها را به لیست لینکهای منتظر برای دریافت اضافه میکند.
5. تکرار فرآیند: این فرآیند برای هر لینک جدید در لیست ادامه مییابد. اسپایدر به صورت پیوسته لینکهای جدید را پیدا کرده و صفحات جدید را دریافت میکند.
6.ذخیره اطلاعات: اطلاعات استخراج شده مانند عنوان صفحه، متن، تصاویر و لینکها در پایگاه داده موتور جستجو ذخیره میشود.
7. فهرستبندی: پس از جمعآوری اطلاعات از صفحات وب، این اطلاعات توسط موتور جستجو فهرستبندی و به کاربران در نتایج جستجو نمایش داده میشود.
این فرآیند به صورت پیوسته ادامه مییابد تا وبسایتهای جدید پیدا شده و اطلاعات بهروز شده را دریافت کند.
برچسب ها: طراحی-سایت, اندروید, اپلیکیشن
مطالب مرتبط
رتبه الکسا چیست
رتبه الکسا چیست شاید شما هم به دنبال این..